دانشگاه محمد بن زاید برای هوش مصنوعی (MBZUAI) که یک دانشگاه تحقیقاتی متمرکز بر هوش مصنوعی است، روز سهشنبه از مدل جدیدی با هزینه پایین رونمایی کرد که به رقابت با OpenAI و DeepSeek میپردازد. این رونمایی پس از آن انجام شد که DeepSeek، یک آزمایشگاه هوش مصنوعی چینی، اوایل امسال با معرفی مدل استدلالی R1 جهان را شگفتزده کرد و اعلام کرد که این مدل میتواند با هزینههای آموزشی بسیار کمتر از OpenAI عملکرد بهتری داشته باشد.
مدل K2 Think با 32 میلیارد پارامتر، به مراتب کوچکتر از سیستمهای رقیب OpenAI و DeepSeek است. این مدل بر اساس مدل متنباز Qwen 2.5 شرکت علیبابا ساخته شده و بر روی سختافزاری که توسط سازنده تراشههای هوش مصنوعی Cerebras ارائه شده، اجرا و آزمایش میشود.
مدل R1 از DeepSeek دارای 671 میلیارد پارامتر است. پارامترها متغیرهایی هستند که مدلهای زبان هوش مصنوعی برای درک و تولید زبان یاد میگیرند. OpenAI تعداد پارامترهای مدلهای خود را فاش نمیکند. K2 Think با همکاری G42، شرکتی که در امارات متحده عربی مستقر است و از سوی غول فناوری آمریکایی مایکروسافت حمایت میشود، توسعه یافته است. محققان این مدل میگویند که عملکرد آن با مدلهای استدلالی اصلی OpenAI و DeepSeek قابل مقایسه است، با این حال اندازه آن بسیار کوچکتر است.
آنها به معیارهای AIME24، AIME25، HMMT25 و OMNI-Math-HARD اشاره کردند که به ریاضیات، معیار برنامهنویسی LiveCodeBenchv5 و معیار علمی GPQA-Diamond مربوط میشوند.
هکتور لیو، مدیر موسسه مدلهای بنیادین MBZUAI، به CNBC گفت که تیم پشت K2 Think توانسته است با استفاده از چندین روش به چنین سطوح بالایی از عملکرد دست یابد. این روشها شامل تنظیم دقیق نظارت شده زنجیرهای طولانی (CoT) و مقیاسبندی در زمان آزمون است که تکنیکی برای بهبود عملکرد با تخصیص منابع محاسباتی اضافی در حین «استنتاج» است.
لیو افزود: «آنچه که در مورد مدل ما خاص است این است که ما آن را بیشتر به عنوان یک سیستم میبینیم تا فقط یک مدل. بنابراین، بر خلاف یک مدل متنباز معمولی که میتوانیم فقط آن را منتشر کنیم، ما واقعاً مدل را مستقر میکنیم و میبینیم که چگونه میتوانیم مدل را در طول زمان بهبود دهیم.»
دو کشور در صحنه جهانی به عنوان پیشگامان در رقابت هوش مصنوعی شناخته میشوند: ایالات متحده و چین. غولهای فناوری و استارتاپهای آمریکایی مانند OpenAI پیشتاز این حرکت بودند. اما پیشرفت DeepSeek با R1 اوایل امسال موقعیت چین را به عنوان یک بازیگر قدرتمند در عرصه هوش مصنوعی تقویت کرد. اخیراً، امارات متحده عربی تلاش کرده است تا خود را به عنوان یک رهبر جهانی در زمینه هوش مصنوعی معرفی کند تا نفوذ جغرافیایی خود را افزایش دهد و اقتصاد خود را از وابستگی به نفت خام متنوع کند.
در این راستا، G42 به عنوان یک نمونه از پیشرفتهای این منطقه در زمینه هوش مصنوعی مطرح است. اما این کشور با رقابت شدیدی از سوی عربستان سعودی مواجه است که به دنبال توسعه قابلیتهای کامل هوش مصنوعی از طریق Humain، شرکتی که تحت صندوق سرمایهگذاری عمومی در ماه مه راهاندازی شد، است.
علاوه بر این، پیچیدگیهای ژئوپولیتیکی نیز بر آرزوهای هوش مصنوعی امارات سایه افکنده است. سرمایهگذاری و همکاری مایکروسافت با G42 سال گذشته در ایالات متحده توجه زیادی را جلب کرد.
در حالی که K2 Think عملکردی در سطح OpenAI نشان میدهد، توسعهدهندگان این سیستم میگویند که هدف آن ساخت یک چتبات مانند ChatGPT نیست. ریچارد مورتون، مدیر اجرایی موسسه مدلهای بنیادین MBZUAI، توضیح میدهد که این مدل برای استفاده در زمینههای خاصی مانند ریاضیات و علم طراحی شده است.
مورتون گفت: «واقعیت این است که استدلال بنیادی مغز انسان سنگ بنای تمام فرآیندهای تفکر است. با این کاربرد خاص، به جای اینکه 1,000 یا 2,000 انسان پنج سال وقت بگذارند تا به یک سؤال خاص فکر کنند، این مدل این دوره را به شدت کاهش میدهد.»
او همچنین افزود که این مدل میتواند دسترسی به فناوریهای پیشرفته هوش مصنوعی را در مناطقی که به نوعی سرمایه و زیرساختی که شرکتهای آمریکایی دارند، دسترسی ندارند، گسترش دهد. «آنچه ما کشف میکنیم این است که میتوانید با کمتر، کارهای بیشتری انجام دهید.»
منبع: CNBC
نظری برای این خبر ثبت نشده است .